【论文阅读笔记】Research Progress of News Recommendation Methods, 2020

您所在的位置:网站首页 timeliness of news 【论文阅读笔记】Research Progress of News Recommendation Methods, 2020

【论文阅读笔记】Research Progress of News Recommendation Methods, 2020

2022-05-22 22:08| 来源: 网络整理| 查看: 265

摘要

由于研究者的目标是研究不同业务领域的个性化推荐,因此对特定领域的推荐方法的总结具有现实意义。新闻推荐系统是关于推荐系统最早的研究领域,也是最早应用协同过滤方法的推荐领域。此外,新闻是实时的,内容丰富,这使得新闻推荐方法比其他领域更具挑战性。因此,本文综述了有关新闻推荐方法的研究进展。从2018年到2020年,开发的新闻推荐方法主要是基于深度学习、基于注意力和基于知识图谱的。截至2020年,有许多新闻推荐方法结合了注意机制和知识图谱。然而,这些方法都是基于基本方法(协同过滤方法、基于内容的推荐方法和两者结合的混合推荐方法)开发的。为了使研究人员能够详细了解新闻推荐方法的发展过程,本文调查的历时近10年的新闻推荐方法根据上述基本方法分为三类。本文首先介绍了每一类方法的基本思想,然后根据每一类方法和研究结果的时间顺序,总结了与其他方法相结合的推荐方法。最后,本文还总结了新闻推荐系统所面临的挑战。

1. Introduction

推荐系统(RS)[1]是一种主动将服务推送给用户,通过“引导”的方式向用户推荐用户偏好相关信息,并根据用户偏好的变化不断更新推荐内容的工具。RS不仅节省了用户获取信息的时间,而且还允许用户探索更多的潜在兴趣。同时,RSs也被认为是最有效的信息暴露手段。新闻网站是人们获取与工作和日常生活紧密相关的信息的重要渠道。必须及时、准确地向用户提供所需的信息。以“雅虎新闻”网站为例,如果用户读到一篇题为“南美人惊叹于日全食”的新闻,该网页就会自动显示与日全食相关的内容。

图1中的演示仅显示了非注册用户浏览了一段新闻后推荐的新闻内容。如果用户注册到该网站或在移动设备上登录到该新闻网站,他们可以得到更多满足自己个人喜好的新闻推荐。

由于不同业务领域的需求不同,研究人员对每种类型的领域提出了不同的推荐方法(如电子商务[2]、旅游[3]、社交网络[4]、news[5])。与其他商业领域不同,新闻门户网站具有很强的实时性能、快速的更新速度和大量的内容。每个新闻项目都包含大量的文本内容。新闻推荐系统首先使用基于用户的协同过滤(UserCF)方法[6],然后开始使用基于内容(CB)推荐方法[7]、基于模型的协同过滤推荐方法(如矩阵分解方法)[8]、混合CB和CF方法(如基于深度学习[9]的推荐方法、基于注意力的方法[10]、基于知识图(KG)的方法[11])。近年来,深度学习和知识图谱方法已成为新闻推荐方法研究领域的热门技术。2017年,Park等人。[9]首先在新闻推荐领域使用了深度学习方法。该方法采用递归神经网络(RNN)和卷积神经网络(CNN)两种方法获取用户轮廓。2018年,[10]的作者首次利用注意机制实现了新闻推荐中的用户形象。同年,[11]的作者首次利用知识图谱实现了新闻推荐领域的用户档案。然后在2019年和2020年,研究者将注意机制、知识图谱和深度学习方法相结合,设计了新闻推荐方法,从而提高了推荐结果的准确性。

为了向研究人员提供近年来新闻推荐系统的广泛概述,本综述概述了2011-2020年发表的研究成果,包括一些关于新闻推荐方法的代表性相关论文。与其他新闻推荐方法的综述不同[5,12-15],本文从最基本的新闻推荐方法的基本思想出发,遵循推荐方法的发展,逐步总结了新闻推荐方法的研究进展。

本文总结分为六个步骤:

新闻的特点和一般新闻推荐框架,CF方法的基本思想及其研究进展关于新闻推荐方法,基本思想的推荐方法和研究进展应用于新闻推荐方法,结合CB和CF的基本思想推荐方法和研究进展应用于新闻推荐方法,新闻推荐评价指标方法,新闻推荐方法的研究前景。2. The Characteristics of News and the General News recommendation Framework2.1 The characteristics of news

与电子商务、旅游、视频等其他推荐系统推荐的项目相比,新闻主要以:及时性强、新闻内容丰富、邻近性强。

(1)及时性强

新闻文章是对最近事实的报道,具有社会意义,引起公众的兴趣。及时性体现在两个方面:最新出现和新内容。用户可能会更多关注时事新闻。

(2)新闻内容丰富

新闻有一个固定的结构,一般包括标题、标题、主题、背景和结论。为了方便检索,一些新闻网站的编辑会在新闻文章中添加关键字。此外,每个新闻内容都包含大量的主题信息,如体育、医疗和音乐。每个新闻项目的背景也暗示了新闻中呈现的信息。因此,新闻内容的挖掘是新闻推荐方法中的一项重要任务。

(3)邻近性强

新闻项目是接近用户的地理或想法和兴趣。事件的位置越接近用户的位置,用户越关心事件,新闻对用户的价值就越高。问题越接近用户的重要利益,用户给予它的关注越多,新闻对用户的价值就越高。

由于新闻具有上述特点,新闻推荐系统面临的挑战包括在短时间内分析大量新闻内容,充分考虑新闻推荐中新闻的及时性和流行程度,以及准确挖掘新闻事件。此外,由于新闻网站的大多数用户都是未注册的用户,新闻推荐系统面临着大量用户的冷启动问题。

2.2 The general news recommendation framework

近年来,由于新闻内容中包含的大量信息,许多推荐方法受到了越来越广泛的关注。在选择新闻数据分析时,不仅考虑了网站上的新闻数据本身,还考虑了使用辅助数据(如跨领域数据、知识库)来分析新闻内容,如图2所示。

通用新闻推荐框架

data processing layer 数据处理层,提取到和关联到的数据,以及进行词嵌入处理。 user datauser datauser browsing information datasocial network dataknowledge basesearch engine toolsnews recommendation model layer semantic modeltopic modelmachine learning modeldeep learning modeloutput layer3. The Basic Idea and Progress of CF-Based News Recommendation Methods3.1 The Basic Idea of CF Recommendation Methods

three steps:

使用用户评级数据生成用户项矩阵通过皮尔逊相关系数计算用户的相似度根据用户的相似性来预测用户对未读新闻的评级。CF methods memory-based CF methods UserCFmodel-based CF methods ItemCFLFMmatrix factorization (MF)

几种主要协同过滤方法的优缺点

3.2 Progress of CF-Based News Recommendation Methods3.2.1 Combining with clustering-based methods

与协同过滤相结合的聚类方法包括新闻聚类和用户聚类。新闻聚类方法还考虑了新闻内容的表示。为了介绍该方法的完整性,本节介绍了所有与聚类方法相关的新闻推荐方法。

新闻推荐系统包括三个组件:

news statics server (NSS)news personalization server (NPS)news front end (NFE)

推荐的过程

scalable two-stage personalized news recommender system (SCENE)

news articles clusteringuser profile constructionpersonalized news recommendation

locality sensitive hashing (LSH)

WordNet-enabled k-means (W-kmeans)

session identificationclustering user sessionsrecommendation stage

基于集群的CF新闻推荐方法的总结

CF方法与聚类方法的结合提高了推荐性能。但是,这种组合存在一些缺点:(1)在聚类时不考虑新闻的及时性;(2)不考虑用户的上下文信息;(3)对于类别不均匀的数据,很难使用聚类方法;(4)[19]的作者只考虑推荐新闻的多样性,而其他方法不考虑多样性。

3.2.2 Combining with the MDP-based method4. The Basic Idea and Progress of News Recommendation Methods Based on CB4.1 The Basic Idea of CB-based methods

基于内容的新闻推荐方法的推荐流程

基于内容的新闻推荐方法包括两部分。一个引入新闻和用户,另一个在分析后计算相似性。研究人员还研究和改进了这两个方面的新闻推荐方法。

4.2 The Progress of CB News Recommendation Methods4.2.1 VSM-Based Weight Calculate Methods

但是,这些方法也存在一些缺点,如不删除停止词,不考虑文章中特定单词的位置信息,不考虑同义词,不考虑单词之间的关系,以及对词汇的高度依赖。此外,还没有考虑到推荐结果的多样性。

4.2.2 Combining with Social Networks-Based Methods

基于社交网络的新闻推荐方法的总结

总之,社交网络的使用可以缓解新闻推荐中的冷启动问题,并根据新闻中的流行趋势来推荐新闻。然而,社交网络为新闻内容分析提供的辅助信息有限,不能准确地分析新闻中的实体和实体之间的关系。此外,在上述基于社交网络的新闻推荐方法中,没有考虑到新闻推荐的多样性和与新闻相关的领域知识。

5 The Progress of News Recommendation Methods Based on Combine CF and CB5.1 Combining with search engine

搜索引擎是丰富新闻内容和计算新闻相似性的一种方法。

虽然搜索引擎可以快速检索新闻内容,但在挖掘新闻内容方面仍存在一些缺陷,如在新闻内容中缺乏事件分析、实体分析和同义词分析。此外,搜索引擎结果的可靠性。

5.2 Combining with the timeliness of news

由于新闻内容的及时性,新闻推荐方法在新闻生命周期中受到了关注。

[62]的作者提出了一种体育新闻的推荐方法。RS有两个组件,一个是基于cb的组件,另一个是基于cf的组件。在基于内容的组件中,只推荐三天内的新闻文章,而在基于cf的组件中,推荐较旧的新闻文章。在分析新闻文章时,可以提取出5到10个关键词来表示新闻文章。KPI(关键性能指标)和SUS(系统可用性规模)的结果评价良好。

[63]的作者还提出了一种CB和CF的混合的方法,即FeRe。在该方法的CB部分,不仅考虑新闻内容,还考虑了新闻的流行程度和趋势。例如,不同类型的新闻有不同的生命周期。因此,用户对不同类型的新闻有不同的偏好。有些新闻用户并不关心新闻什么时候出现,而是更关注内容。在该方法的CF部分,通过计算用户之间的相似性来对候选新闻预测进行评分。实验表明,FeRe方法的召回率优于单独的CB法或CF法。

[64]的作者提出了一种基于会话的推荐方法,使用CF方法和CB方法来计算新闻文章的相似性。CF方法使用会话-项目矩阵。

一些研究人员还认为,新闻的流行程度是一个推荐因素[65,66]。例如,[65]的作者提出了一种在线推荐方法,该方法结合了趋势和短期用户习惯,考虑了项目的生活周期,并将新闻项目分为三个类别(非常流行、中等流行、不受欢迎)。[66]的作者提出了一个基于最流行的策略的在线和离线推荐方法。

综上所述,虽然推荐的结果在新闻受欢迎度和新闻生命周期方面的准确性有所提高,但仍存在以下问题:(1)忽略了用户完全偏好的获取。例如,只获得当前会话中的偏好[64],而其他方法只获得用户的长期偏好,而忽略用户的短期偏好;(2)忽略了新闻内容之间的联系;(3)忽略了对用户重要的流行新闻与新闻之间的关系。

5.3 Combining with Deep Learning Methods

基于MF的思想,[67]的作者首先提出了神经协同滤波方法。2017年,深度学习方法首次在新闻推荐领域采用[9]。与机器学习方法相比,深度学习方法的优势是具有更强的学习能力和泛化能力。自2017年以来,基于cf的新闻推荐方法采用了递归神经网络(RNN)和卷积神经网络(CNN)模型。RNN模型包含双向RNN(Bi-RNN)和长短期记忆网络(LSTM),该模型用于序列数据建模。CNN模型包含一维CNN、二维CNN和3维CNN。类似于RNN的一维CNN,主要用于序列数据的建模。二维CNN主要用于图像数据的建模,三维CNN主要用于视频数据的建模。CNN还用于新闻推荐方法中新闻项目的向量表示建模。[9]的作者使用了两种不同的RNN模型:一个RNN模型用于基于会话数据的建模,另一个RNN模型用于基于会话和用户点击历史的建模。该研究还使用了CNN模型来获取用户的长期兴趣偏好。

[68]的作者提出了一种基于cnn的三维新闻推荐方法。该模型包含三个部分(三维张量、三维卷积和分数聚合)。三维张量部分使用一个三维结构来表示相似度张量。建议的推荐框架如下。

基于三维CNN的新闻推荐框架

[69]的作者也使用了3-DCNN模型。所提出的模型体系结构包括用户历史记录组件和项目组件组件。用户历史组件使用三维CNN模型,项目组件使用二维CNN模型。[70]的作者不仅使用用户的浏览信息,还使用新闻的内容信息,并通过用户浏览的新闻信息获取文章嵌入。本文提出的推荐模型包括两个组件(用户配置文件组件和文章表示组件)。用户配置文件组件用于通过doc2vec[42]嵌入从新闻标题和内容中生成向量表示。本文的表示组件采用了一种类似于MF的方法,并使用一个神经网络建立了一个计算用户偏好和候选集之间的相似性的模型。在相似度计算过程中,使用逻辑函数直接生成目标用户的推荐列表。模型架构如图7所示。

[71]的作者提出了混合循环注意机(HRAM)推荐模型,它也由两个组件组成。第一个分量使用广义矩阵分解的方法来预测用户将给出的新闻文章。第二个组件是用户历史记录组件,它是由一个基于注意力的递归网络来实现的。该模型的体系结构如图8所示。

在上述深度学习方法中,用基于用户特征和新闻特征的点乘法方法取代了传统的基于id的矩阵分解法,并添加了多层神经网络,使模型结果比传统的MF方法更准确。但是,这些方法仍存在一些不足之处:(1)他们不考虑新闻的及时性 (2)推荐的结果缺乏多样性 (3)他们忽略了新闻内容的细粒度表示 (4)不考虑用户的上下信息。

5.4 Combining with Attention-Based Methods

注意机制主要用于挖掘用户兴趣偏好的热点,从新闻文章中获取关键词。基于注意机制的推荐方法包括一个或多个注意层。在新闻推荐模型中,新闻配置文件方面使用了一个CNN,而用户配置文件方面使用了一个RNN,然后添加了一个不同的注意机制层。新闻简介方面的注意机制提取了关键的词、实体、事件等。用户配置文件方面的注意机制提取了用户互联网的热点。

[10]的作者提出了深度融合模型(DFM),该模型可应用于项目检索和项目重新排序。DFM包括一种表征学习和一种注意机制。与使用其他领域知识的冷启动用户相比,其他用户直接使用新闻领域。该模型利用一种注意机制来缓解上述因素,并让模型动态地结合来自不同领域的知识。该模型在曲线下面积(AUC)[74]和日志损失方面表现优于比较的模型(逻辑回归(LR)、梯度增强决策树(GBDT)、分解机(FM)、SVDFM、DeepFM、YeutubeRank[72]和DeeppWide[73])。

[75]的作者提出了深度注意力神经网络(DAN)模型,该模型使用了这两种基于注意力的模型。采用基于注意的RNN(ARNN)模型发现用户点击量的顺序特征,采用基于注意的神经网络(ANN)模型发现用户感兴趣的特征。DAN模型包括三个模型(PCNN、ANN和ARNN)。PCNN被用作新闻表示提取器(结合基于CNN的标题嵌入和基于cnn的新闻嵌入实体的PCNN模型),神经网络用于提取用户兴趣,ARNN被用作序列信息提取器(使用LSTM模型)。值得注意的是,与研究中的其他方法(LibFM、DSSM[76]、深宽、DeepWepede、DMF、DKN[11])相比,DAN模型丰富了新闻文章的呈现。

[78]的作者提出了一种具有个性化注意的神经(NPA)模型方法。NPA模型包含三个模块(新闻编码器模块、用户编码器模块、点击预测模块)。新闻编码器模块旨在表达新闻。新闻编码器模块包含三个子模块(单词嵌入、上下文表示和使用注意机制挖掘导入单词)。用户编码器模块用于从用户点击后的新闻的表示中学习用户的表示。点击预测器模块用于预测目标用户在每个候选新闻项目上的点击得分。该方法在AUC、平均倒数秩(MRR)和NDCG指标方面均优于比较方法(LibFM;CNN;DSSM;WideDeep;deepFM;DFM;DKN)。

[79]的作者提出了一个主题感知的新闻编码器,而新闻编码器中的一个用户编码器使用了一个CNN和一个注意力网络来表示新闻标题。新闻编码器包含三层(单词嵌入表达层、CNN网络层、注意机制层)。单词嵌入表达式层将一个新闻标题从一个单词序列转换为一个向量序列。CNN网络层使用CNN来通过捕获本地上下文来学习上下文单词表示。注意机制层选择新闻标题中的重要词汇来学习信息性的新闻表示。用户编码器使用用户的浏览器历史记录和注意网络作为用户的表示。同时增加了新闻主题分类模型来预测新闻主题。该方法在AUC、MRR和NDCG指标方面优于比较方法(LibFM、CNN;DSSM;WideDeep;DFM(深度融合模型);DKN;GRU)。

注意机制比其他基于内容的方法更全面地生成新闻向量表示,可以以基于单词级别的细粒度方式表示新闻,并可以更好地挖掘用户的兴趣。然而,上述基于注意机制的新闻推荐方法仍然存在以下问题:(1)忽略各注意层之间的信息丢失;(2)忽略用户长期和短期偏好的差异;(3)不考虑新闻实体之间的关系,影响新闻推荐的准确性;(4)没有考虑新闻的流行度和及时性;(5)不考虑用户的上下文信息,影响用户的阅读体验。同样,在注意机制的方法中也没有考虑到推荐结果的多样性。

5.5 Combining with Knowledge Graph-Based Methods

谷歌于2012年提出知识图谱技术。它于2018年首次应用于新闻推荐领域,也是近年来[11]的研究热点。KG是一种使用图模型来表示知识的方法。它被划分为一般的KG(FreeBase[80],Yago[81])和域的KG(新闻图[82])。许多使用KG的方法也结合了注意机制[82,83,84],因此更适合于新闻向量表示。

[11]的作者提出了深度知识感知网络(DKN)框架,该框架将一个知识图引入到新闻推荐中,并添加了一个注意模块。DKN框架是一个基于内容的CTR预测推荐,适合于高度时间敏感的新闻。这个知识图由包含相关实体的新闻内容组成。DKN包含了一个关键的组件,即知识感知的卷积神经网络(KCNN),以融合词级和知识级的新闻表示,并生成一个知识感知的嵌入向量。实验结果表明,f度值和曲线下面积(AUC)优于其他模型(基于特征的分解模型[85];知识动力卷积神经网络,KPCNN[86];深度结构语义模型,DSSM;深度宽;DeepFM[87];YouTubeNet[72];深度矩阵分解模型,DMF[88])。

[89]的作者提出了一种新的基于自我注意的模型。与DKN模型相比,该模型使用了词级描述,而不是主题级描述。注意模型包含四个层次的自我注意模块(单词级、项目级、用户级和多头注意)。单词级模型将新闻文章中的单词转换为基于单词的表示。项目级模型融合了单词、实体和上下文之间的表示。用户级模型用于构建用户嵌入模型。采用多头注意模型将历史新闻和候选新闻连接起来,然后通过一个全连接层计算CTR。所提出的方法优于比较了AUC度量和NDCG度量的方法(LR、DNN、DeeeFM、DeepWide、DKN、流行度)。

[82]的作者提出了新闻图;这是第一次将知识图应用于新闻领域来实现新闻推荐任务。新闻图是基于微软服务网络(MSN)新闻数据,协作关系添加到原始KG,包括相同的新闻三元组、相同的用户三元组和相同的会话三元组。为了验证新闻图的有效性,实验验证了四个任务(预测用户对新闻项目的点击量、新闻分类、新闻受欢迎程度、新闻项目位置与本地用户兴趣的匹配程度)。实验结果表明,News图在上述任务的准确性、AUC和f1分数指标上均优于原始KG。

[90]的作者提出了SED(短距离超过知识图)方法,该方法包括三个步骤:(1)在FreeBase中查找新闻中涉及的命名实体,然后找到这些实体连接的节点;(2)根据第一步中找到的节点生成子图;(3)通过计算实体之间的最短距离在子图中找到相似的新闻。此外,90的作者提出了KG研究的公共数据集CNRec。SED方法可以缓解冷启动问题,将SED方法与传统的TF-IDF和doc2vec方法相结合,也可以提高推荐性能。

[83]的作者提出了主题丰富的知识图推荐系统(TEKGR),该系统通过在新闻实体和相关主题中挖掘外部知识,改进了现有的KG方法。TEKGR框架分为三层(使用KG用三种编码方法对新闻标题进行建模,通过注意机制获取用户的兴趣表达,并使用点生产方法计算用户在候选新闻上的得分)。实验表明,TEKGR在AUC和f1评分指标上优于比较方法(DKN、DeepFM、LibFM、LSTUR[91])。

[84]的作者提出了一种图增强表示学习(GERL)方法,这是一种图表示和注意机制的混合方法。GERL不仅对用户和新闻进行建模,还考虑了用户和新闻的邻居,从而提高了用户与新闻之间的学习能力。此外,在生成新闻向量表示时,还应用了变压器[92]模型。实验表明,根据AUC、MRR、NDCG等指标计算,GERL方法优于DKN、LibFM、DSSM等方法。

[93]的作者提出了一个基于node2vec的[94]经济新闻推荐模型。该方法主要用于向用户推荐与股票相关的经济新闻,并在模型中考虑了新闻的及时性。本文建立了一个证券知识图谱,其中包括股票、行业知识、相关概念等内容。实验表明,该模型优于传统的CF和CB推荐方法,在实际应用中可以为用户实时推荐个性化的经济新闻。

KG可以弥补推荐系统中的冷启动问题,并挖掘出更多潜在的新闻信息。因此,推荐结果的准确性得到了提高,但上述基于KG的新闻推荐方法仍然有以下缺点:(1)没有考虑新闻事件的连续性;(2)KG中有太多的命名实体和链接节点,没有考虑重要的实体和链接,这使得该方法更适合在线环境中的推荐应用;(3)KG的创建不考虑跨语言领域知识,KG不能直接用于完成跨语言推荐;(4)在新闻领域,领域KGs不多。例如,[82]的作者创建了一个专门用于新闻推荐的KG

6 Evaluation Metrics in News Recommendation Methods

近年来研究论文对推荐方法的评价主要集中在推荐方法的精度、推荐列表排名的有效性、实时推荐的有效性和推荐的应用效果等方面。在这些指标中,除均方根误差(RMSE)和平均绝对偏差(MAE)外,其他指标的值越大,推荐效果越好。

推荐的精度[95]的评估指标包括精度、查全率、命中率(HR)、[95]测量(或[95]分数)、准确性、RMSE和MAE。精度表示用户对推荐列表中列出的新闻感兴趣的概率。召回表示用户感兴趣的新闻被推荐的概率。HR表示每个用户的Top-k推荐列表中正确的新闻推荐项目的总数。它是top-k推荐方法中使用的召回率的评价指标。F-meacle(或FScore)指标综合考虑精度和召回率。准确性度量表示正确推荐的新闻项目数量与所有新闻样本数量之间的比率。RMSE和MAE用于预测用户对新闻的评分,例如,基于MF的推荐方法。

推荐列表排序有效性的评价指标包括归一化贴现累积增益(NDCG)、平均平均精度(MAP)和曲线下面积(AUC)[74,96]。NDCG用于表示用户和推荐的新闻项目之间的相关性。MAP与NDCG类似,但在MAP度量中,用户和推荐的新闻项目之间的相关性是一个二元相关性。AUC衡量了推荐系统对正用户-项目交互的排名高于负用户-项目交互的概率。

实时推荐的实际应用的评价指标包括[62]中的kpi(关键性能指标)和SUS(系统可用性规模)。kpi度量,用于评估推荐系统是否状况良好。SUS度量,用于评价推荐系统的可用性。

推荐应用效果的评价指标包括点击通过率(CTR)度量、Kappa统计度量[50]和平均倒数排名(MRR)度量[74]。CTR度量用于评估推荐的新闻点击次数。Kappa统计量是一个度量所提出的分类是否比随机猜测的更好。MRR度量用于评估推荐列表的优缺点。

7 Prospects for News Recommendation Methods

可以看出,在对上述新闻推荐方法的研究中,研究人员主要关注个性化推荐和推荐的准确性。然而,关于用户疲劳、非个性化的新闻推荐、隐私保护、新闻多样性等方面,仍然是未来新闻推荐研究的重要问题。

7.1 User Fatigue in News Recommendation

新闻推荐系统中向用户推荐的新闻与用户浏览历史中的新闻相似,使用户在阅读新闻时感到疲劳,从而影响用户的阅读体验。然而,在新闻推荐方法中很少考虑用户疲劳的因素。用户疲劳定义为用户对重复推荐的项目失去兴趣,新闻项目的CTR用于衡量用户疲劳[97]。而[97]的作者只考虑了用户的性别、年龄和新闻项目的CTR,而没有考虑新闻项目的语义关系、用户的长期和短期兴趣等。如何衡量用户阅读疲劳的因素也是一个值得研究的问题。此外,缓解用户阅读疲劳的多样性和意外疲劳方面也可以在新闻推荐方法中得到进一步研究。

7.2 Privacy Protection in News Recommendations

大多数新闻推荐方法都是基于用户的历史行为。因此,这些方法忽略了对用户行为的隐私保护。[98]的作者指出,在新闻推荐领域,基于隐私保护的推荐方法相对较少,但在新闻领域也是一个值得研究的问题。2020年,[99]的作者提出了一种基于局部差异隐私(LDP)[100]的新闻推荐方法。此方法的目的是要将用户的行为只保存在用户的设备中,而不是将用户数据上传到服务器上。用户的肖像不是一个用户的肖像,而是用户的群体肖像,从而弥补了由于缺乏用户信息而对用户肖像的准确性的影响。

7.3 Non-personalized in News Recommendations

[101]的作者提出了一种基于未来影响的非个性化新闻推荐方法。该方法的目的是为用户提供未来将成为热点的新闻(用户将给予更多关注的新闻)。非个性化新闻推荐方法不仅缓解了冷启动问题,而且降低了在线新闻推荐方法的复杂性。然而,非个性化的推荐并不考虑用户的偏好,也会影响一些用户的体验。因此,非个性化推荐与个性化推荐方法的结合也是未来新闻推荐方法的研究方向。

7.4 Recommendation of Long-Tail News

长尾新闻指的是很少被推荐的新闻。由于用户很少浏览长尾新闻,长尾新闻浏览记录很少。在推荐模型中,长尾新闻很少成为用户所推荐的新闻。然而,长尾新闻也很有价值,需要由推荐系统来挖掘,并推荐给目标用户。由于新闻的及时性,很难及时、准确地挖掘能满足用户喜好的长尾新闻。因此,在未来的新闻推荐方法中,长尾新闻的推荐模型是一个重要的研究方向,可以利用KG或注意机制进行建模。

7.5 Recommendation of High-Quality News

在新闻推荐方法中,推荐结果只考虑准确率,不考虑新闻的质量。高质量的新闻指的是内容的真实性、精细性和完整性。同一事件通常会有很多新闻报道,很难找到最好的新闻推荐给用户。以时事新闻为例,高质量新闻具有精炼、权威性。高质量新闻内容的挖掘与新闻内容分析方法的选择密切相关。未来,高质量新闻的推荐将考虑缩小候选新闻的范围(即根据事件对新闻进行分类后分析新闻内容,删除假新闻内容),分析社交媒体上的新闻内容,用专家知识分析新闻内容。

8. Conclusions

新闻推荐系统的出现减少了用户查找新闻的时间,可以及时、准确地向用户推荐感兴趣的新闻。新闻推荐系统的研究是推荐系统研究领域的一个热点。首先介绍了新闻推荐的特点和一般新闻推荐框架,分析了新闻推荐方法的研究进展,最后总结了新闻推荐方法的评价指标,并讨论了新闻推荐方法的前景。我们希望对相关领域的研究人员提供所有帮助。

本文使用 Zhihu On VSCode 创作并发布



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3